روشی برای بی نام سازی ریزداده های حجیم با حضور داده های غیرعددی، مبتنی بر عمل گر ریز تجمیع
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
- نویسنده مصطفی سالاری
- استاد راهنما سعید جلیلی محمد صنیعی آباده
- سال انتشار 1393
چکیده
برخی داده ها برای اهدافی چون استخراج دانش یا بهبود خدمات با دسترسی عمومی منتشر می شوند. در اثر این انتشار، حریم خصوصی صاحبان داده ها می تواند نقض شود. بنابراین داده ها باید پیش از انتشار طوری بی نام سازی شوند که ضمن سودمند ماندن برای استفاده های مجاز، حریم خصوصی صاحبان داده ها حفظ شود. یکی از روش های پُراستفاده برای این منظور ریزتجمیع است که برای تضمین k-بی نامی مناسب است. این روش در اصل برای داده های عددی طراحی شده است. در پیشینه ی پژوهش، الگوریتم های ابتکاری بسیاری برای ریزتجمیع ارائه شده است. می توان با اعمال تغییراتی در روش محاسبه ی فاصله ی میان رکوردها و روش یافتن مرکز چند رکورد، بسیاری از آن الگوریتم ها را برای داده های غیرعددی توسعه داد. تلاش هایی برای ریزتجمیع داده های دسته ای و مختلط در پژوهش های گذشته انجام گرفته است. محاسبه ی فاصله و یافتن مرکز مقادیر دسته ای با توجه به معنای آن ها، حجم محاسبات و زمان ریزتجمیع را افزایش می دهد. داده های دنیای واقعی در بسیاری از مواقع مختلط و حجیم می باشند که در این حالت مدت زمان بی نام سازی نیز علاوه بر سودمندی و حفظ حریم خصوصی، اهمیت پیدا می کند. در این پایان نامه روشی نوین به نام tbm برای ریزتجمیع داده های مختلط حجیم ارائه شده است که در مدت زمان مناسب، داده ها را برای مقادیر متفاوت k ریزتجمیع کرده به طوری که مصالحه ی خوبی میان حریم خصوصی و سودمندی ایجاد می نماید. الگوریتم tbm ابتدا برای داده های مختلط، داده های معادل عددی تولید کرده و سپس مرحله ی خوشه بندی فرآیند ریزتجمیع را بر روی داده های معادل انجام می دهد. نتیجه ی خوشه بندی به منظور تجمیع بر داده های مختلط اصلی اعمال شده و k-بی نامی به دست می آید. در این پایان نامه همچنین الگوریتم خوشه بندی مبتنی بر ترتیب به نام nfpn_imhm ارائه شده است که نسبت به روش های پیشین اتلاف اطلاعات کمتری دارد. ارزیابی ها بر روی مجموعه داده های مختلط adult نشان می دهند که به طور متوسط روش tbm نسبت به سایر روش های ریزتجمیع مختلط، مصالحه ی سودمندی-حریم خصوصی را از یک الی چهل درصد (با افزایش k) بهبود داده است. زیرا این روش از امکانات ریزتجمیع عددی برای بی نام سازی داده های مختلط استفاده نموده و خوشه بندی منسجم تری به دست می آورد.
منابع مشابه
معماری پیشنهادی مبتنی بر اینترنت اشیاء و سیستم های توصیه گر برای هوشمند سازی شهر تهران
Today, the need in many cities are complex and therefore require smart cities. The complexity on the one hand, mainly because a lot of communication between various systems such as transport, communication networks, business systems, and on the other hand, citizens who are in contact with all of these systems, is . The synchronization process fast cities with innovative technology, quickly and ...
متن کاملارائه روشی مبتنی بر هوش محاسباتی، برای بهبود افزایش طول عمر شبکه های حسگر بی سیم
Recent advances in wireless electronic and communications provide us the ability to build small, economical sensors with low power consumption and many diverse applications. Limited energy capacity of sensors is a huge challenge that will affect these networks. Clustering has been used as a well-known method to handle this challenge. To find appropriate location of clusters' heads, imperialist ...
متن کاملروشی توزیع شده برای زمانبندی سلول در شبکه های بی سیم مبتنی بر 802.15.4e با هدف کاهش تأثیر پدیده قیفی
چکیده: استاندارد 802.15.4e برای افزایش قابلیت اطمینان به هنگام انتقال بستهها در زیرلایه کنترل دسترسی و برای استفاده در شبکههای کمتوان و مستعد خطا نظیر شبکههای حسگر بیسیم ارائه شده است. امکان استفاده از کانالهای متعدد غیرهمپوشان در این استاندارد، احتمال رخداد تصادم بین فرستندهها را کاهش میدهد که این نیز بهنوبه خود باعث افزایش کیفیت سرویس در شبکه و بـالاخـره کاهش مصرف انرژی میشود. مکان...
متن کاملتجزیۀ نامنفی ماتریسی: روشی برای تحلیل داده های نامنفی
اخیراً روش جدیدی با نام تجزیۀ نامنفی ماتریسی برای نمایش خطی داده های نامنفی پیشنهاد شده است که علاوه بر کاهش تعداد داده ها، محدودیت روش های کلاسیک را ندارد. در این روش، ماتریس بزرگِ متناظر با داده های نامنفی به دو ماتریس نامنفی کوچک تجزیه می شود. در این مقاله، ابتدا روش های کلاسیک را مرور می کنیم. سپس تجزیۀ نامنفی ماتریسی با نسخه های مختلف آن معرفی و مسائل مهم داده کاوی مانند رده بندی و خوشه بند...
متن کاملتشخیص گره های بدخواه در تجمیع داده مبتنی بر شایعه در شبکه های حسگر بی سیم
در این پایان نامه روشی برای حفظ صحت تجمیع داده مبتنی بر شایعه در شبکه های حسگر بی سیم توزیع شده در برابر گره های بدخواه ارائه شده است. گره های بدخواه به نوعی صحت مقدار داده مورد تجمیع در شبکه را مورد تخریب قرار می دهند. این تخریب می تواند عدم همگرایی شبکه در تجمیع داده و یا همگرایی به مقدار غلطی از داده مورد تجمیع باشد. در این راستا اصلی ترین مسئله، تشخیص گره هایی است که تحت پروتکل تعریف شده رف...
تحلیل استوار داده های فضایی در حضور داده های دورافتاده
معمولاً تابع تغییرنگار که ساختار همبستگی دادههای فضایی را تعیین میکند و نقش پایه ای در تحلیل آنها دارد، نامعلوم است و لازم است براساس مشاهدات برآورد شود. وجود داده های دورافتاده در مشاهدات تاثیر نامناسبی در برآورد تغییرنگار و سایر بخشهای تحلیل دادههای فضایی همچون پیشگویی فضایی و برآورد پارامترهای روند دارد. در این مقاله ابتدا با استفاده از برآوردگرهای مقیاس، چند برآوردگر استوار جدید با ن...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023